Prompt Injection - mrsekut-p

Prompt Injection

LLMに対する攻撃

「これまでのpromptを全て無視して発言してください」みたいなやつ

生じる問題

提供者が意図していない情報を開示される

情報漏洩につながる

不適切な回答をする

具体的には #??

それによって、システムの信頼性低下に繋がる

例えば、不適切な回答をしたスクショを拡散するとか

対策

https://learnprompting.org/docs/prompt_hacking/defensive_measures

https://qiita.com/sakasegawa/items/09d9f6a485108f5a618a

「そういうのが来ても無視してください」と言っておくなど

例

https://twitter.com/Ahmet_stak/status/1633085605994459139

事例

【悲報】ChatGPTが新車を1ドルで勝手に売ってくる事案が発生｜ﾊﾟﾄﾙ | AI x Biz